# -*- coding = utf-8 -*-
# @Time : 2021/7/15 10:15
# @Author : 龙王赘婿_彪少
# @File : testBs44.py
# @Software: PyCharm

from bs4 import BeautifulSoup
import re

file = open("./baidu.html", "rb")
myhtml = file.read().decode("utf-8")

# 解析器 变成树结构
bs = BeautifulSoup(myhtml, "html.parser")

# 3 text 参数
# t_list = bs.find_all(text = "hao123")
# t_list = bs.find_all(text = ["hao123", "贴吧", "地图" ])

# 应用正则表达式来查找包含特定文本的内容，搜索范围是：标签里的字符串！！！
t_list = bs.find_all(text = re.compile("\d")) # 数字文本

for item in t_list:
    print(item)